Bölüm 17 MTK

Klasik gerçek puan modelinde birey özellikleri ile test özelliklerini birbirinden ayırmak güçtür, her biri diğerinin bağlamında yorumlanır.

Psikometride ilgilenilen birey özelliği testle ölçülen yetenektir.

KTK çerçevesinde yetenek kavramı gerçek puanla ifade edilir ve gerçek puan testte gözlenen performansın beklenen değeri olarak tanımlanır.

KTK çerçevesinde bir bireyin yeteneği sadece belli bir teste göre tanımlanır. Bireylerin yeteneği test maddelerinin zor veya kolay olmasına bağlıdır.

Test zor bir testse, birey düşük yeteneğe sahip gibi görünecektir, test kolay bir testse, birey daha yüksek yeteneğe sahip gibi görünecektir.

KTK çerçevesinde bir test maddesinin güçlüğü testi alan bir birey grubunda maddeyi doğru yanıtlayan birey oranıdır.

Bir maddenin kolay veya zor olması ölçülen bir grup bireyin yeteneğine bağlıdır.

Klasik test kuramı çerçevesinde madde ve test güçlüğünün yanı sıra madde ayırt ediciliği ve test puanlarının güvenirliği de belli bir grup bireye göre tanımlanır.

Birey özellikleri test bağlamı değiştikçe değişir, madde ve test özellikleri de birey bağlamı değiştikçe değişir.

Bu nedenle farklı testleri alan bireylerin ve özellikleri farklı birey grubundan elde edilen maddelerin karşılaştırılması oldukça zordur.

Teste bağlı birey puanları, farklı testleri alan bireyleri karşılaştırırken, sınırlı kullanıma sahiptir.

Gruba bağlı madde indeksleri, madde indekslerinin elde edildiği birey grubundan farklı birey grupları için testler geliştirirken, sınırlı kullanıma sahiptir.

KTK çerçevesinde ele alınan güvenirlik tanımı ve kavramsal olarak güvenirlik kavramının zıttı olarak düşünülen ölçmenin standart hatası kavramı belli problemleri beraberinde getirmektedir.

KTK çerçevesinde güvenirlik kavramı bir testin paralel (eşdeğer) formlarından elde edilen puanlar arasındaki korelasyon olarak tanımlanır. Uygulamada paralel test tanımını sağlamak oldukça zor, hatta imkansızdır.

Güvenirliğin alt sınır kestirimlerini sağlayan veya bilinmeyen yanlılıklara sahip güvenirlik kestirimleri veren çeşitli güvenirlik katsayıları bulunmaktadır.

Test puanlarının güvenirliğinin ve varyansının bir fonksiyonu olan ölçmenin standart hatasının testi alan bütün bireyler için aynı olduğu varsayılır. Ancak farklı yeteneklerdeki bireyler için elde edilen test puanları farklı miktarlarda hatalar içermektedir.

KTK madde odaklı değil test odaklıdır. Klasik gerçek puan modeli bireylerin bir maddeyi nasıl yanıtladığını ele almaz.

KTK bir bireyin veya bir grup bireyin belli bir test maddesinde nasıl bir performans göstereceği hakkında tahminlerde bulunulmasına izin vermez.

Halbuki bir bireyin belli bir maddeyi doğru yanıtlama olasılığı gibi bir bilgi, belli birey grupları için belli özelliklerde testler tasarlarken önemlidir.

Ayrıca KTK ile testlerin geliştirlmesinde, yanlı maddelerin belirlenmesi, uyarlamalı testlerin yapılandırılması, test puanlarının eşitlenmesi gibi birçok test geliştirme probleminde çok kesin çözümler sunmamaktadır.

  • KTK sınırlılıklarından dolayı psikometrisyenler KTK'ya alternatif ölçme kuramlarının arayışı içine girmiştir. Alternatif bir ölçme kuramı aşağıdakileri içermelidir.

    • Grup bağımlı olmayan madde istatistikleri
    • Test bağımlı olmayan birey yeterliliğini tanımlayan puanlar
    • Güvenirlik kestiriminde tamamen paralel testler gerektirmeyen bir model
    • Her yetenek puanı için bir ölçme kesinliği sağlayan bir model
    • Test düzeyinden ziyade madde düzeyinde kurulan bir model
  • Bu özellikler madde tepki kuramı veya gizil özellik kuramı olarak bilinen alternatif ölçme kuramının çerçevesinde elde edilebilir.

17.1 Madde Tepki Kuramı

MTK'da veya gizil özellik kuramında bir testteki maddelere verilen yanıtların test maddelerinden daha az sayıdaki gizil özellikler tarafından açıklanacağı varsayılmaktadır.

Kuramın çoğu uygulamasında bir testteki maddelere verilen yanıtların tek bir gizil özellik tarafından açıklanacağı varsayılır.

MTK gizil özelliğin farklı düzeylerindeki bireylerin maddeyi nasıl yanıtlayacağını matematiksel olarak gösterir.

Bu matematiksel model farklı testleri alan bireylerin performanslarının karşılaştırılmasına izin verir.

Bu model madde analizinin madde analizlerinde kullanılan gruptan farklı yetenek düzeylerindeki gruplara uygulanmasına izin verir.

  • MTK iki temel varsayıma dayanır.

    • Bir bireyin bir test maddesindeki performansı özellik(ler), gizil özellik(ler) veya yetenek(ler) olarak adlandırılan faktör(ler) tarafından yordanabilir (veya açıklanabilir).

    • Bireylerin madde performansı ve madde performansının altında yatan bir grup özellik arasındaki ilişki madde karakteristik fonksiyonu (MKF) veya madde karakteristik eğrisi (MKE) olarak adlandırılan ve monotonik olarak artan bir fonksiyonla tanımlanır.

17.2 Madde Karakteristik Eğrisi (MKE)

  • MKE testteki bir maddeyi doğru yanıtlama olasılığını testteki maddelerdeki performansın altında yatan gizil özelliğin bir fonksiyonunu gösteren bir eğridir.

MKE madde performansı altında yatan tek bir gizil özellik (yetenek) olduğu durumdaki madde karakteristik fonksiyonunu gösterir.

Grup üyeliğinden bağımsız olarak, gizil özelliğin yüksek değerlerine sahip bireylerin maddeyi doğru yanıtlama olasılığı gizil özelliğin düşük değerlerine sahip bireylerin maddeyi doğru yanıtlama olasılığından daha yüksektir.

17.3 Madde Tepki Kuramı Sayıltıları

MTK modelleri modelin uygulandığı veri hakkında bir takım sayıltılar gerektirir.

Sayıltıların uygulanabilirliği doğrudan belirlenemez, ancak dolaylı bazı kanıtlar toplanabilir ve değerlendirilebilir. Ayrıca modelin veriye genel uyumu da değerlendirilebilir.

Yaygın olarak kullanılan MTK modellerinin sayıltılarından biri testi oluşturan maddeler tarafından sadece bir yeteneğin ölçüldüğüdür. Bu sayıltı tek boyutluluk sayıltısı olarak adlandırılır.

  • Tek boyutlulukla ilgili bir kavram yerel bağımsızlık kavramıdır.

17.4 Tek Boyutluluk ve Yerel Bağımsızlık

KTK'da iki değişken arasındaki ilişkiden söz edilirken genellikle korelasyon kavramından yararlanılır.

MTK'da iki değişken arasındaki ilişkiden bahsedilirken daha genel bir kavram olan istatistiksel bağımsızlık kavramından yaralanılır. İki tane iki kategorili madde için aşağıdaki dört eşitlik karşılanıyorsa istatistiksel bağımsızlıktan söz edilir:

  • \(P_i(+)\) i maddesini doğru yanıtlama olasılığı
  • \(P_i(-)\) i maddesini yanlış yanıtlama olasılığı
  • \(P_j(+)\) j maddesini doğru yanıtlama olasılığı
  • \(Pj_(+)\) j maddesini yanlış yanıtlama olasılığı

\(P(+,+) = P_i(+)P_j(+)\) \(P(+,-) = P_i(+)P_j(-)\) \(P(-,+) = P_i(-)P_j(+)\) \(P(-,-) = P_i(-)P_j(-)\)

Tek boyutluluk maddeler arasındaki istatistiksel bağımlılık terimiyle tanımlanır.

Yerel bağımsızlık gizil özelliğe göre homojen olan herhangi bir alt evren için maddelerin istatistiksel bağımsız olması anlamına gelir.

Tek boyutluluk ve yerel bağımlılık eşdeğer kavramlar değildir.

Örneğin, testteki madde çiftleri için yerel bağımsız olacak şekilde iki gizil özellik bulunuyorsa, test iki boyutludur. Genel olarak bir testin boyutu yerel bağımsızlığı sağlamak için gerekli gizil özellik sayısına eşittir.

17.5 Madde Tepki Kuramı Modelleri

Sonsuz sayıda MTK modeli tasarlamak mümkün olmakla birlikte, az sayıda model uygulamada kullanılmaktadır.

En popüler tek boyutlu MTK modelleri arasındaki temel ayrım, maddeleri tanımlamak için kullanılan parametrelerin sayısındadır.

  • En popüler üç tek boyutlu MTK modeli
    • bir-parametreli lojistik (1-PL)

    • iki-parametreli lojistik (2-PL)

    • üç-parametreli lojistik (3-PL) modellerdir.

  • Bu modeller iki kategorili madde yanıt verisi için uygundur.

17.6 Bir-Parametreli Lojistik (1-PL) Model

1PL model yaygın olarak kullanılan MTK modellerindendir. 1PL model için madde karakteristik eğrileri aşağıdaki eşitlikle elde edilir:

\[P_i(\theta) = \frac{exp(\theta-b_i)}{1+exp(\theta-b_i)} = \frac{1}{1+exp[-(\theta-b_i)]}\] \[ln(\frac{P_i(\theta)}{1-P_i(\theta)})=\theta - b_{i}\]

Burada,

  • \(P_i(θ)\) : θ yetenek düzeyindeki bir bireyin i maddesini doğru yanıtlama olasılığı

  • \(b_i\): i maddesinin güçlük parametresi

  • Bir madde için \(b_i\) parametresi yetenek ölçeğinde maddeyi doğru yanıtlama olasılığının 0.5 olduğu noktadır.

  • Bu parametre yer parametresi olup yetenek ölçeğiyle ilişkili olarak madde karakteristik eğrisinin pozisyonunu belirtir.

\(b_i\) parametresinin daha büyük değerleri, bir bireyin maddeyi doğru yanıtlamak için %50 şansa sahip olması için daha büyük yetenek düzeyine sahip olmasını gerektirir. Diğer bir ifadeyle \(b_i\) parametresinin daha büyük değerleri, daha zor maddeyi ifade eder.

  • Zor maddeler yetenek ölçeğinin sağında veya daha yüksek ucundadır.
  • Kolay maddeler yetenek ölçeğinin solunda veya daha düşük ucundadır.

Bir grubun yetenek düzeyleri ortalaması 0 ve standart sapması 1 olacak şekilde ölçeklendiğinde, \(b_i\) değerleri genel olarak -2.0 ile +2.0 arasında değişir.

  • \(b_i\) değerleri -2.0’ye yakın olan maddeler bireyler için oldukça kolay,*

  • \(b_i\) değerleri +2.0’ye yakın olan maddeler bireyler için oldukça zor maddelerdir.

  • \(b_i\) yetenek düzeyiyle aynı ölçektedir.

\(b_i\) ve \(\theta\) düzeyi arasındaki fark logit ölçeğindedir. logit bir olasılık değerinin bir dönüşümüdür.

\(logit(p)= ln(\frac{p}{1-p})\)

log(0.5/0.5)

log(0.1/0.9)

log(0.9/0.1)
## [1] 0
## [1] -2.197225
## [1] 2.197225

Örneğin

  • \(logit(0.01)=ln(\frac{0.01}{0.99})=-4.595\)

  • \(logit(0.1)=ln(\frac{0.1}{0.9})=-2.197\)

  • \(logit(0.6)=ln(\frac{0.6}{0.4})=0.405\)

  • \(logit(0.99)=ln(\frac{0.99}{0.01})=4.595\)

  • \(logit(0.9)=ln(\frac{0.9}{0.1})=2.197\)

  • \(logit(0.4)=ln(\frac{0.4}{0.6})=-0.405\)

\(logit(0.5)=ln(\frac{0.5}{0.5})=0\)

Olasılık değerleri tek biçimli (uniformly) dağıldıysa, logit değerlerinin dağılımı standart normal dağılıma oldukça yakındır.

tekbicimli <- runif(5000,0,1)
logs <- log(tekbicimli/(1-tekbicimli))

50000 tek biçimli değişken

hist(tekbicimli)

logit değerleri

hist(logs)

17.7 1PL - MKE

Elimizde 1PL modelde uygun dört maddelik bir testte yer alan madde parametreleri bulunsun.

  • Madde 1 için \(b_1 = 1.0\)

  • Madde 2 için \(b_2 = 2.0\)

  • Madde 3 için \(b_3 = -1.0\)

  • Madde 4 için \(b_4 = 0.0\)

\[P_i(\theta) = \frac{1}{1+exp[-(\theta-b_i)]}\]

Eğriler yetenek ölçeğinde sadece yerleri bakımından farklılık gösterir.

1-PL modelinde birey performansını etkileyen tek madde özelliği madde güçlüğüdür.

1-PL modelinde KTK madde ayırt edicilik indeksine karşılık gelen bir madde parametresi yoktur.

Bu bütün maddelerin eşit ayırt ediciliğe sahip olduğunu varsaymaya eşdeğerdir.

1-PL modelinde madde karakteristik eğrilerinin alt asimptotu sıfırdır.

  • Bu çok düşük yetenek düzeyine sahip bireylerin maddeyi doğru yanıtlama olasılığının sıfır olduğunu belirtir.

  • Böylece çoktan seçmeli maddelerde düşük yetenek düzeyine sahip bireylerin tahmin olasılığına izin verilmez. Tahmin olmaması sayıltısı çoktan-seçmeli maddeleri içeren bir testin çok kolay olduğu durumlarda karşılanabilir.

17.8 İki-Parametreli Lojistik (2-PL) Model

2-PL model yaygın olarak kullanılan MTK modellerindendir.

2-PL model için madde karakteristik eğrileri aşağıdaki eşitlikle elde edilir:

\[P_i(\theta) = \frac{exp[a_i(\theta-b_i)]}{1+exp[a_i(\theta-b_i)]}=\frac{1}{1+exp(-[a_i(\theta-b_i)])}\]

\[ln(\frac{P_i(\theta)}{1-P_i(\theta)})=a_i(\theta - b_{i})\]

Burada,

  • \(P_i(\theta)\): θ yetenek düzeyindeki bir bireyin i maddesini doğru yanıtlama olasılığı

  • \(b_i\): i maddesinin güçlük parametresi

  • \(a_i\): i maddesinin ayırt edicilik parametresi

  • Çoğu durumda ai(θ - bi), D = 1.7 normalleştirme sabitiyle çarpılır.

Tarihsel olarak MTK modeli kümülatif normal model (normal ogive model) olarak geliştirilmiştir. Ancak zamanla kümülatif normal model yerine, matematiksel olarak daha kolay ele alındığından, kümülatif lojistik model kullanılmaya başlamıştır.

Eğer \(a_i(θ - b_i)\) 1.7 normalleştirme sabitiyle çarpılırsa, iki model arasındaki fark neredeyse ihmal edilir düzeyde olacaktır. Yetenek düzeyinin bütün değerleri için iki modelle elde edilen olasılık değerleri arasındaki fark 0.01’den küçük olacaktır.

BILOG ve MULTILOG gibi özelleşmiş çoğu MTK yazılımı sadece lojistik modeli kullanır.

D sabitinin kullanılıp kullanılmaması tercihe kalmıştır.

Bir madde için \(a_i\) parametresi yetenek ölçeğinde \(b_i\) noktasında madde karakteristik eğrisinin eğimiyle orantılıdır.

Daha dik eğimli maddeler farklı yetenek düzeylerindeki bireyleri ayırmada daha az eğimli maddelere göre daha kullanışlıdır.

  • Bir maddenin bir θ yetenek düzeyinin yakınındaki bireyler arasındaki ayırt ediciliği

  • (θ düzeyine eşit veya daha düşük yetenek düzeyine sahip bireyleri θ düzeyinden yüksek yetenek düzeyine sahip bireylerden ayırma gücü) θ değerindeki madde karakteristik eğrisinin eğimiyle belirlenir.

  • \(a_i\) değerleri kuramsal olarak (-∞, +∞) ölçeğindedir.

  • Başarı testlerinde eksi yönde ayırt ediciliğe sahip maddeler, testten çıkarılır.

  • Çünkü yetenek düzeyi arttıkça maddenin doğru yanıtlanma olasılığının düşmesi maddeyle ilgili bir probleme (yanlış anahtarlama gibi) işaret eder.

  • Ayrıca uygulamada genellikle 2.0’den büyük ayırt edicilik değerlerine rastlanmaz. Bu nedenle \(a_i\) parametresi için olağan aralık (0, 2)’dir.

17.9 2PL - MKE

Elimizde 2PL modelde uygun dört maddelik bir testte yer alan madde parametreleri bulunsun.

  • Madde 1 için \(b_1\) = 1.0 ve \(a_1\) = 1.0

  • Madde 2 için \(b_2\) = 2.0 ve \(a_2\) = 0.5

  • Madde 3 için \(b_3\) = -1.0 ve \(a_3\) = 1.5

  • Madde 4 için \(b_4\) = 0.0 ve \(a_4\) = 1.2

Eğriler 1-PL modelinde olduğu gibi paralel değildir. Her eğrinin eğimi farklılık gösterir. Bu da madde ayırt edicilik parametrelerinin farklı olduğunu yansıtır.

2-PL modelinde birey performansını etkileyen madde özellikleri madde güçlüğü ve madde ayırt ediciliğidir.

2-PL modelinde 1-PL modelinde olduğu gibi madde karakteristik eğrilerinin alt asimptotu sıfırdır.

Bu çok düşük yetenek düzeyine sahip bireylerin maddeyi doğru yanıtlama olasılığının sıfır olduğunu belirtir. Böylece çoktan seçmeli maddelerde düşük yetenek düzeyine sahip bireylerin tahmin olasılığına izin verilmez.

Tahmin olmaması sayıltısı çoktan-seçmeli maddeleri içeren bir testin çok zor olmadığı durumlarda karşılanabilir.

17.10 3-PL Model

3-PL model için madde karakteristik eğrileri aşağıdaki eşitlikle elde edilir:

\[P_i(\theta) = c_i + (1- ci)* \frac{exp[a_i(\theta-b_i)]}{1+exp[a_i(\theta-b_i)]}=c_i +\frac{1-c_i}{1+exp(-[a_i(\theta-b_i)])}\] \(P_i(θ):\) θ yetenek düzeyindeki bir bireyin i maddesini doğru yanıtlama olasılığı

  • \(b_i\) : i maddesinin güçlük parametresi

  • \(a_i\) : i maddesinin ayırt edicilik parametresi

  • \(c_i\) : i maddesinin sahte-tahmin parametresi

Tahmin yerine sahte-tahmin denmesinin nedeni, parametrenin tahminden fazlasını içermesidir. Örneğin, madde yazarları çekici ancak yanlış seçenekler geliştirebilir.

Seçmeli-yanıtlı (çoktan-seçmeli gibi) maddeler gibi tahmin yoluyla doğru yanıtlara izin veren madde formatlarından elde edilen verilere 1-PL ve 2-PL modellerin uygulanmasında problemle karşılaşılabilir.

1-PL ve 2-PL modellerinde maddeyi doğru yanıtlama olasılığı yetenek düzeyi düştükçe sıfıra yaklaşır. Ancak çok düşük yetenek düzeyindeki bireyler için bile maddeyi doğru yanıtlama olasılığı, bireyler doğru yanıtı tahmin edebileceklerinden sıfırdan büyüktür.

3-PL modelinde yer alan \(c_i\) parametresi, seçmeli-yanıtlı test maddelerindeki performansta tahminin bir etken olduğu durumlarda, yetenek ölçeğinin düşük ucundaki performansı hesaba katar.

Sıfırdan farklı \(c_i\) parametresi, testi alan herhangi bir bireyin maddeyi doğru yanıtlama olasılığının sıfırdan farklı olduğunu yansıtır.

Yetenek düzeyinin çok düşük değerleri için bile bireylerin en az %20’si maddeyi doğru yanıtlayacaktır.

17.11 3-PL - MKE

Elimizde 3PL modelde uygun altı maddelik bir testte yer alan madde parametreleri bulunsun.

  • Madde 1 için \(b_1\) = 1.0 ve \(a_1\) = 1.8 ve \(c_1\) = 0
  • Madde 2 için \(b_2\) = 1.0 ve \(a_2\) = 0.8 ve \(c_2\) = 0
  • Madde 3 için \(b_3\) = 1.0 ve \(a_3\) = 1.8 ve \(c_3\) = 0.25
  • Madde 4 için \(b_4\) = -1.5 ve \(a_4\) = 1.8 ve \(c_4\) = 0
  • Madde 5 için \(b_5\) = -0.5 ve \(a_5\) = 1.2 ve \(c_5\) = 0.10
  • Madde 6 için \(b_6\) = 0.5 ve \(a_6\) = 0.4 ve \(c_6\) = 0.15

Madde 1 ve Madde 4 arasındaki karşılaştırma, b parametresinin MKE şeklindeki rolünü vurgulamaktadır.

Madde 1 ve Madde 2 arasındaki karşılaştırma, a parametresinin MKE dikliğindeki rolünü vurgulamaktadır.

Madde 1 ve Madde 3 arasındaki karşılaştırma, c parametresinin MKE şeklindeki rolünü vurgulamaktadır.

6 maddeden hangi madde θ = -1.0 değerinde en kolay maddedir?

## NULL

Yandaki 6 maddeden hangi madde θ = 0.0 değerinde en zor maddedir?

Yandaki 6 maddeden hangi iki madde θ = -1.0 değerinde eşit güçlükteki maddelerdir?

Yandaki 6 maddeden hangi madde θ = 3.0 değerinde en ayırt edici maddedir?

## NULL

17.12 Madde Bilgi Fonksiyonu

Teknik olarak, bilgi bir parametre kestiriminin standart hatasının tersiyle ilişkili bir değerdir.

  • Yüksek bilgi değeri parametre kestirimi hakkında daha fazla bilgiye sahip olunduğunu belirtir.

MTK'da bilgi birey yeteneğini kestirmek için kullanılan maddelerin toplamından elde edilen bilgiyi ifade eder.

Bilginin miktarı yetenek değerine bağlıdır, bu nedenle test bilgi fonksiyonu olarak adlandırılır.

Bilgi miktarı uygulamada test düzeyinde değerlendirilir. Ancak bilgi madde düzeyinde elde edilir ve test bilgi fonksiyonu \(I_T(θ)\) madde bilgi fonksiyonlarının \(I_i(θ)\) toplamıdır.

    • \(I_T(θ)= \sum{I_i(θ)}\)

i maddesi için belli bir yetenek düzeyinde (θ değerinde) bilgi miktarı için farklı MTK modellerinde kullanılan eşitlikler aşağıdaki gibidir:

1PL

  • \(I_i(θ)=P_i(θ)*Q_i(θ)\)
    • \(Q_i(θ)=1-P_i(θ)\)

2PL - \(I_i(θ)=a_i^2P_i(θ)*Q_i(θ)\)

3PL

  • \(I_i(θ)=a_i^2 \frac{Q_i(θ)}{P_i(θ)}[\frac{P_i(θ) - c_i}{1- c_i}]^2\)

17.12.1 1-PL Modeli için Madde Bilgi Fonksiyonu

1-PL (a = 1.0, c = 0.0, D = 1.7 sabiti yok)

b = 1.2 madde güçlüğü ile θ = 1.0 yetenek düzeyindeki bir birey için

\[P_i(\theta) = \frac{1}{1+exp[-(\theta-b_i)]}\] \[P_i(1) = \frac{1}{1+exp[-(1-1.2)]} = 0.45\] \(I_i(θ)= 0.45 * (1-0.45) =2.48\)

p <- 1/(1+exp(-(1-1.2)))
p * (1-p)
## [1] 0.2475166
b <- c(1.2)
theta <- seq(-4,4,0.01)

prob <- c()
  for(j in 1:length(theta)){
    dir <- 1/(1 + exp(-(theta[j] - b)))
    prob[j] <- dir
    j=j+1
  }
bilgi =  prob * (1- prob)

p <- data.frame(prob,bilgi)
MBF <- ggplot(p, aes(theta, bilgi)) +
  geom_line()
MBF

17.12.2 2-PL Model Madde Bilgi Fonksiyonu

2-PL (a = 0.8, c = 0.0, D = 1.7 sabiti yok)

b = 1.2 madde güçlüğü ile θ = 1.0 yetenek düzeyindeki bir birey için

b <- 1.2
a <- 0.8
theta <- seq(-4,4,0.01)
p <- 1/(1+exp(-(0.8*(1-1.2))))
a^2 * p * (1-p)
## [1] 0.1589804
prob <- c()
  for(j in 1:length(theta)){
    dir <- 1/(1 + exp(-(a*(theta[j] - b))))
    prob[j] <- dir
    j=j+1
  }
bilgi =  a*a * prob * (1- prob)

p <- data.frame(prob,bilgi)
MBF2 <- ggplot(p, aes(theta, bilgi)) +  geom_line()
MBF2

17.13 Test Bilgi Fonksiyonu

Bireysel maddelerin teste katkısının miktarı testteki diğer maddelerin bilgisi olmadan belirlenebilir.

  • Bu klasik test kuramında mümkün değildir.

  • Örneğin, güvenirlik veya nokta-çift serili korelasyon testteki maddelerin geri kalanından bağımsız olarak belirlenemez.

  • Testteki madde sayısı daha fazlaysa, daha yüksek test bilgi fonksiyonu elde edilir.

Lord (1977) tarafından önerilen test geliştirme yöntemi:

  • Beklenen test bilgi fonksiyonunun şekli belirlenir: Hedef bilgi fonksiyonu Örneğin,

Maddeler seçilir ve test bilgi fonksiyonu hesaplanır ve hedef bilgi fonksiyonuyla karşılaştırılır.

Bir önceki basamak beklenen sonuçlar elde edilene kadar tekrar edilir.

17.14 Maksimum Bilgi

i maddesi için maksimum bilgi farklı MTK modellerinde aşağıdaki yetenek düzeylerinde (θ değerinde) elde edilir:

1-PL - \(\theta=b_i\)

2-PL - \(\theta=b_i\)

3-PL - \(\theta=b_i + \frac{1}{Da_i}[ln\frac{1 + \sqrt{1+8c_i}}{2}]^2\)

1-PL (a = 1.0, b = 1.2, c = 0.0)

  • \(\theta=b_i=1.2\)

2-PL (a = 0.8, b = 1.2, c = 0.0) - \(\theta=b_i=1.2\)

3-PL (a = 0.8, b = 1.2, c = 0.2, D =1.7 sabiti yok)

  • \(\theta=b_i=1.53\)

17.15 Madde Tepki Kuramı

Klasik Test Kuramı Madde Tepki Kuramı
Standart hata ve güvenirlik tüm puanlar için aynıdır. Standart hata ve güvenirlik puanlara ve maddelere göre değişkendir. Her puan seviyesi ve cevap örüntüsü için ayrı ayrı kestirilir.
Test uzunluğu güvenirliği artırır. Daha kısa ve amacına uygun testler eşit derecede güvenilir olabilir.
Test özellikleri örnekleme bağımlıdır. Test özellikleri örneklemden bağımsızdır.
Karma formattaki testler toplam test puanında dengesizliklere neden olur. Karma test formatı kolaylıkla ele alınabilir.
Öğrencileri kıyaslamak için paralel test formlarına gerek vardır. Farklı ölçmeler ortak bir metrik üzerine yerleştirilebildiğinden öğrencileri kıyaslamak görece kolaydır.
Toplam puanlar sıralama ölçeğindedir. Toplam puanlar eşit aralıklı ölçektedir.
Kayıp veri sorun yaratır. Kayıp veri beklenen bir durumdur.

17.16 Kaynaklar